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Precede de production d'une proteine recombinante 
d'interet et proteine produite. 

L' invention a pour objet un nouveau precede de 
5 production de proteine d'interet, en grande quantity 
dxrectement utilisable pour des analyses structurales 
Invention concerne egaletnent la proteine recombinante 
obtenue . 

10 „ X B r *° ePteUrS °° Upl « 3 Prolines G < RC PGs, 

constituent una super-f amille de prolines membranaires 
caracterisees par 7 domainas transmembranaires (TO I i VII) 
gui jouent un r61e primordial dans la communlcation 
intercellular at la reception daa signaux sensoriels [1] 

15 »™. AVe ° PXUSiSUrS «•»*•*»- da membres identifies, las 
15 RCPGs constituent la famine structural at fonctionnelle 
da recepteurs membranaires la plus importante. n s 
represented notamment una part significative du g l„o M 
humam connu a ce jour (au moins 700 recepteurs, 0.5 % du 
genome) . 

Exprimes a la surfaca da toutas las callulas d'un 
orgamsme (da la lavura a l-nomme), ils sont actives par 
una tras grande varists de 

' P T ^' h0rm ° neS ' 11PideS ' m0lScul - "dorantas, lumiere. 
nucleotides, nucleosides, molecules du gout. etc...,. LeU r 
-5 actuation antr al na una cascada intracallulaira da signaux 
par 1- intermediate da prolines G at resulte an un grand 
nombre da reponses callulairas (par example division ou 
contraction callulaira, neurotransmission) . 

10 cha^^ f 90n . 9 * nSrale ' les «W »o„t implies dans 
cheque fonction physiologique . ^'importance da cas 
racaptaurs ainsi gua la connaissanca da laur localisation 
callula lr a las deeigne corona das ciblas idealas da la 
tharapautigua. Et ef fectivement. on paut estimer qua pres 
da 50% das medicaments sur le march* agissent via las 
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RCPGs. Beaucoup de pathologies sont la consequence de 
mutations des RCPGs, et leurs manifestations clinigues sont 
bl6n COnnues < on Peut citer par exemple cecite, diabete 
xnsipide nephrogenic^, hypo- ou hyperthyroidisms, puberte 
precoce, obesite [2] . 

La decouverte que certains reoepteurs des chemokines 
sont des cofacteurs de 1- infect ion par le virus HIV 
renforce 1-idee que les RCPGs sent implies dans une 
grande variete de situations pathologiqv.es [3] . 

ces considerations generales indiquent clairement la 
necessite d'etudier 1- architecture f onctionnelle de ces 
reoepteurs, afin de mieux comprendre le processus de 
transduction du signal et la dynamique de leurs 
interactions avec diverse* molecules <li gan ds ou 
partenaires intracellulars) . ainsi que pour developper de 
nouveaux outils pharmacologies et 

Cependant, 1- etude de 1- architecture f onctionnelle des 
RCPGs par les Rhodes experimental « directes » 
(crxstallcgraphie aux rayons X, RMN, spectrometrie de 
masse) reste encore tres limitee. Une seule structure 

tridimensionnelle (3D) est ach»n....» 

esc actuellement connue, celle de la 

rhodopsine de b«uf [4], du fait du trie fort niveau 
d expression naturel de ce recepteur dans la retine. La 
connaissance de leur architecture f onctionnelle est done 
ahordee actuellement par un f aisceau de Rhodes theoriques 
(moderation) , physico-chimiques (photomarquage 
fluorescence) et biologiques (mutagenese dirigee, 
pharmacologie moleculaire, knock-out, etc.). 

Ces etudes represented un enjeu industriel et socio- 
economic^ de premiere importance, compte tenu des 
applications therapeutiques potentielles. 

cependant 1- etude structurale et f onctionnelle des 
RCPGs est tres difficile pour diverses raisons • 
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- la nature transmembrane de ces proteines et leur 
caractere hydrophobe rendent leur manipulation delicate et 
conduxsent en general a une perte de la f onctionnalite et a 
une denaturation apres solubilisation ; 

- les obtenir dans la totalit-* a* i 

caj - lte de leur seguence 

prxmaxre reste tres difficile t * „i „ 

annt . . . Clle * La Popart du temps, il s 
sent exprxmes sous forme tronguee [5] . 

- ils sont exprimes en guantite tres faible (o Gli- 
des proteines membranaires) ce gui constitue un blocage I 
leur purification en grande guantite , 

kD) " e t 1SUr n P ° idS m ° lgCUlaire est ^eve (superieur a 40 

m o diflcations poet . ;:;:::::::: el i:i \iz z ::::ilt 

P a : . lati Phosphorylation) et de t JJ B 

partxculiers (ponts disulfure) ; 

das do m C ai„ SOnt dM Pr ° t<ineS ™ l " £ °-«onnel l es possedant 
ixgands, actxvation des proteines G, sites aliosterigues 

^j 1 ^ 8 -» — — i-i°n / a 4 sensi b i lisat r:: s ' 

On comprend aisement que 1 „ • • 
. . yue x etape crxtxgue qui 

constxtue actuellement un reel hi™ 

celle de 1 ' /->Kt- fc . blocage est certainement 

celle de l'obtention des RCPGs en des mi«nm-- 

e " aes quantxtes compatibleo 
avec ies approches de oioiogie structure . directes . 

o r and JUS9U ' a Pr * 3ent ' aUOUne SCrat «9i- - Production en 
grande guantite, qgneralidah^ * * 

en outre i ^eneralxsable a tons les RCPGs , permettant 

en outre leur purification sous forme f onctionnelle d'une 
maniere simple n'a • une 

certains rf POint " P ° n ^uelle m ent, 

ZTT ° nt «« P-odu!t. en suantite elevee 

W de culture, [«..,. „ u Xe , mSthodea ^ 

ne s'applrquent pas a une majorite de RCPGs 

Les RCPGs ne represented dans ce denaine de ia 

des drffrcuites qU e 1-on rencontre lors q u-ii s'agit 
d obtenxr une quantite importante d-une proteine d-interet 
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La presente invention a pour but de fournir un precede de 
production en grande quantite d'une proteine d'interet, 
particulierement des RCPGs . 

Les inventeurs ont de maniere surprenante, montre que 
la construction de proteines recombinant es , 
particulierement de proteines membranaires , tres 
particulierement de RCPGs, comprenant au moins un fragment 
d'une integrine alpha et la proteine d'interet, permet 
d'obtenir des proteines recombinantes pouvant etre 
exprimees en grande quantite. Cette strategie permet en 
particulier d'obtenir une production desdites proteine en 
grande quantite dans des microorganismes, particulierement 
dans des bacteries. Lorsque les proteines recombinantes de 
1' invention sont produites dans des bacteries, elle 
s'accumulent dans les corps d' inclusion du cytoplasme 
bacterien. II est alors necessaire de renaturer les 
proteines d'interet pour les obtenir sous forme active en 
une quantite compatible avec une analyse directe de leur 
structure par exemple par cristallographie aux rayons X ou 
par resonance magnetique nucleaire (RMN) . Le precede de 
1' invention pent permettre en outre la production de 
proteines non tronquees, particulidrement lorsqu'il est 
applique aux RCPGs. 

Les int6grines forment une famille de recepteurs lies 
structurellement et f onctionnellement qui participent aux 
interactions cellule-cellule et cellule-matrice extra- 
cellulaire. Toutes les integrines se presentent sous forme 
d'heterodimeres de sous-unites alpha et beta, liees de 
maniere non covalente. Sur la base de leur sequence 
primaire, toutes les integrines alpha presentent une region 
N-terminale constitute de sept sequences en acides amines 
repetees (repetition I a VII), chacune comprenant 
approximativement 60 acides amines. Certaines sous-unites 
alpha incluent un domaine d' insertion (domaine-I) d' environ 



WO 2004/113539 

PCT/FR2004/001538 

200 acides aminea, situa entre les r4pgtit . ons H et 

eesentxellement das saquances consensue pQ 

corraspondant aux anchainamenta phanylalanina. slwl l 
5 glycyl, alanyl, prolyl d'oil 1 =„.. yxycyj. 
FG-GAP ». denomination « ^petition 

des * 11 ° 0miaisSance «- invantaurs. la sous-unita alpha 

aL T B <Par aillSUrS aPPBl4e ^^in- alpna 

Untagrxna „> dans l e taxta, jamais ^ * * 

callnlea autres qua daa callulaa da m am m ifaraa at ce an 
quanta di.acta.ant ccpatibla avac una Laivs! 
atructurala da la protSina dHntSret =. • anal V se 
quantity da ladita nro«H lnteret ' ce nScaaaita una 

XS milligrams " lM P ™ 

a Xig aL a a. PrSSente inVentl ° n *" * catta 
Ainsi, 1-invantion a pour objat pramiar 1'utilisation 

au moms un fragmant d-una integrina alpha pour la 
production d-au mains una protaina racomhinanta d-intlit 

25 r ! anS le Pr * Sent teXte ' l '=-Pr«ssion "protaina 
raco^xnanta.. ou ..protaina racombinanta d-intLt- " 
rapporta a la protslne recombinante 

1'xnvantion. Catta protaina racombinanta pau 2 
partxculxar comprandra 1 ■ snchainament da pluaiaura , 

da cT;;; g a es ssguenoes esp ™ - 

L'axprassion -protaina d-inMrat" sa rapporta a la 
sequsnca paptid ig ua corraapondant . una P ro tS inT vlLl t 
qua 1 ■ on vaut produira ( ou qua 1 • on a produita, . 
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Ainsi, 1-on comprend qu-une "proteine recombinante" 
est constitute d-une ou plusieurs "proteine d-interet" 
eventuellement s6parees par des sequences espaceurs et/ou 
des sequences de clivage. 

Par fragment d'une integrine alpha, on entend aussi 
bxen la sequence en acide amine complete de 1' integrine 
alpha utilisee qu'une sequence partielle. La sequence de 
1' integrine alpha utilisee pent etre native ou mutee 
Preferentiellement selon 1'invention, la sequence utilisee 
est une sequence comprenant 1'extremite N-terminale de 
1' integrine alpha utilisee, encore plus preferentiellement 
une sequence correspondant a 1'extremite N-terminale de 
1' integrine alpha utilisee. 

Selon un mode particulier de 1- invention, le fragment 
de 1- integrine alpha utilise comprend au moins les modules 
FG-GAP IV a VI! et une portion du moduie FG-GAP III de 
1' integrine alpha utilisee. 

Le fragment de 1- integrine alpha utilise pent etre un 
fragment de toute integrine alpha connue . On citera 
particulierement lee integrines oa, a2. a3 , a4 , „ 5> a6 
<«, as. «9, aio, an, «D. aE, aL, aM, ax, alib ou encore 

Selon un mode de realisation particulier de 
!• invention, on utilise un fragment de 287 acides amines 
correspondant a la partie de Lextremite N-terminale de 
1' integrine alpha 5 qui s'etend entre les positions 231 et 
517, selon la numeration tenant compte de la presence du 
peptide signal, si Lon ne tient pas compte du peptide 
signal, le fragment utilisable dans !• invention s'etend des 
positions 190 (residu G, a 476 (residu G) de 1 . integrine 
alphas . 

Lorsque Von utilise d'autres integrines alpha, les 
fragments utilisables selon 1 ' invention sont les fragments 
homologues aux fragments ci-dessus definis. Par exemple 
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quand il s-agit de 1 ■ integrine av, le fragment utilisable 
selon 1- invention correspond a la partie de 1-extremite N- 
terminale de 1 ■ integrine av qui s - etend des positions 211 
(residu G) a 495 (residu G) selon la numeration tenant 
compte de la presence du peptide signal, si 1-on ne tient 
pas compte du peptide signal, l e fragment utilisable dans 
1'invention s'etend des positions 181 (residu G) a 465 
(residu G) de 1 ■ integrine av. Quand il B . agit de 
1' integrine ailb, le fragment utilisable selon 1 ■ invention 
correspond a la partie de Lextremite N-terminale de 
1'xntegrine ailb qui s' etend des positions 224 (residu G) 
a 508 (residu Q) , selon la numeration tenant compte de la 
presence du peptide signal. Si 1-on ne tient pas compte du 
pept.de signal, le fragment utilisable dans 1 ■ invention 
s etend des positions 193 (residu G) a 477 (residu Q) de 
I 1 integrine ailb. 

Selon un mode particulier de 1'invention, la fragment 
de 1'xntegrine alpha utilisee comprend au moins una 
sequence en acides amines choisie parmi les sequences SEQ 
ID a-l (fragment de 1 ■ integrine a5 humaine) , SEQ id n»2 
(fragment de 1' integrine V humaine) et SEQ ID N*3 (fragment 
de 1' integrine ailb humaine), de la liste de sequence 
fournie en annexe. 

seloa un autre m ode particulier de 1'invention, le 
fragment de 1- integrine alpha utilise comprend au moins une 
sequence en acides amines codec par 1-une des sequences en 
nucleotides, choisie parmi les sequences SEQ ID H . 4 
(fragment de !■ integrine as humaine), SEQ ID H-5 (fragment 
de 1-integrine V humaine) et SEQ » N = 6 (fragment de 
1'xntegrine ailb humaine,, de la liste de sequence fournie 
en annexe. 

Selon encore un autre mode de realisation particulier 
de I- invention, il est possible que le fragment de 
1 xntegrine alpha soit utilise dans la construction de 
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Plusieurs ,au moins deux, proteines d.interet 
recombrnantes. Dans ce caa, lea proteines recombinante* 
seront fusionnees lors da la traduction. Cela pent severer 
necessaire dana la caa d.una proteine d.interet pour 
laquelle la construction selon 1 * invention ne permet paa sa 
product.cn directe (proteine refractaire, . n eat alors 
necessaire da coupler an tandem la sequence de ladite 
proterne refractaire a una proteine recombinante d-intaret 
que les constructions fi pi«n i i • 

m - , M selon 1« invention permettent de 

10 produire. Ainsi, selon can-- * 

r . ° n Cette forme Particuliere de 

3 tl0n ^ 1,inVention ' 1* construction selon 
Lxnventxon co m prendra au mo ins un fra^ent d 1 ADN codant 2 

r 7 fra - ent intggrine alpna, puis au mo ins 2 

ADN codant au moina une premiere 
15 d-intSrSt- .„ • P reI »lere proteine recombinante 

a xnteret et au moins un ADN o^t ... 

Mot4ina ,_. codant au morns une aeconde 

protarna recombinante d'interet. Salon ce mode de 
realisation particulier da 1 • invention, 1 1 ADN codant la 
seconde proteine d.interet sera ineere dana la construction 
en phase en aval da la sequence d ' ADN codant la premiere 

ZTV^- CS ^ " rialiSatiM —culler Zl 
etra combrne a Lun quelconque das modes de realisations 
particulars decrits precedemment . 

d-inte g r!n ren r h ellement 1- foment 

5 d- intere t T SitU * ^ ^ -combinante 

interet praparea salon 1- invention, en amont da la 
sequence da la proteine d- interet ,ou dea s Sq uencea das 
proteines d.interet, cue 1-on vise a produire, c-est-a-dire 
du cote »-terminal de la proteine recombinante d- interet 
ou das proteines recombinantas d.interet, que 1-on charcbe 
0 a construire et/ou 4 produire. cuerche 

^invention a egalemant pour objet una proteine 
recombinante caracterisea an ca qu-elle comprend 

ZTZ ea ' aU - m ° inS Un fra9ment in " Srlne «W» tel 

qua defmi precedamment et au moins une proteine d- interet 
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La (ou les) proteine (s) d'interet, partie(s) de la 
proteine recombinante de 1' invention, peut etre toute 
proteine que 1' on cherche a produire, particulierement une 
proteine membranaire, tres particulierement un recepteur 
5 couple aux proteines G (RCPGs) . A titre d'exemple pour ces 
derniers, on peut citer les recepteurs de la vasopressin 
et de l'ocytoeine (Via, V2 , OTR) , lea recepteurs des 
leucotrienes (BLT1, BLT2 , CysLTl, CysLT2) , les recepteurs 
adrenergics (beta 3), l es recepteurs canabinoides (CB1) 
10 les recepteurs des chimiokines ( CCR5 , CXCR4 ) le recepteur 
ATI de 1-angiotensine II, le r6cep teur B2 de la 
bradykinine . 

La proteine recombinante de 1' invention (quel que soit 
le mode de realisation de !■ invention) peut en outre 
15 comprendre toute sequence en acides amines qui permet de la 
purifier de maniere aisee. Ainsi selon un mode particulier 
de 1' invention, la proteine recombinante peut comprendre 
une sequence de 6 residus histidine (tag 6xHIS) . C e tag 
6XHIS peut etre incorpore dans la sequence de la proteine 
en vue de sa purification sur colonne de Ni-NTA (Nickel- 
nitrilotriacetic acid) agarose. Pref erentiellement , cette 
sequence est a 1'extremite C-terminale de la proteine 

recombinante de 1 ' invent- i ^ T 

invention. Lorsque la proteine 

recombinante selon 1 . invention est constitute d-au moins 
25 deux proteines fusionnees, l e tag 6xHIS e-fc 
preferentiellement situe en aval de la derniere des 
proteines d'interet que 1'on cherche a produire. 

La sequence codant la proteine recombinante peut en 
outre comprendre au moins une sequence codant au moins un 
30 site de clivage par une endoprotease . 

De maniere avantageuse, la sequence codant pour les 
derniers residus de 1 • integrine peut etre mutee pour 
constituer un site de clivage pour une endoprotease 
(facteur Xa, thrombine) , qui permettra apres expression et 
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purification de la proline recombinante, de separer la 
proteine d'interet de son partenaire de fusion. Selon une 
forme de realisation particuliere de 1- invention, le residu 
L (position 285) pent itre modifie par mutation en un 
5 residu I, les residus E et G (positions 286 et 287) etant 
conserves. Un residu R supplemental^ pent etre introduit 
par mutagenese. L 1 enchainement ainsi constitue ( IEGR) 
correspond au site de clivage par le facteur Xa qui coupe 
la proteine apres le residu R. 
10 sous une autre forme de realisation, le site de 

clivage au facteur Xa pent etre transforms en un site de 
clxvage a la thrombine. Pour cela les residus I, E , et G 
peuvent etre remplaces par des residus L, V et P. Le residu 
R est conserve afin d-obtenir 1 ■ enchainement LVPR. comme le 
15 fragment integrine a ete incorpore dans le vecteur c6te 3 - 
par un site BamHl (sequence ggatcc) , on obtient done la 
sequence ggatcc codant pour deux residus G et S juste apres 
LVPR. L ' enchainement LVPRGS constitue le site de clivage a 
la thrombine, qui coupe la proteine apres le residu R 
20 on comprend done que dans une forme plus elaboree, la 

proteine recombinante de 1' invention comprend, de son 
extremite N-Terminale a son extremite C-Terminale, le 
fragment d< integrine alpha comportant le site de clivage 
Par une endoprotease , la (ou les) proteine (s) d'interet et 
25 l e tag 6xHIS. 

Sous une forme particuliere, la proteine recombinante 
de 1' invention comprend, de son extremite N-Terminale a son 
extremite C-Terminale, le fragment d< integrine alpha 
comportant le site de clivage par le facteur Xa, la (ou 
30 les) proteine (s) d'interet et le tag 6xHIS . 

Sous une autre forme particuliere, l a proteine 
recombinante de 1' invention comprend, de son extremite N- 
Termxnale a son extremite C-Terminale, l e fragment 
d' integrine alpha comportant le site de clivage par la 
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thrombine, la (ou les) proteine (s) d'interet et le tag 
6xHIS . 

II peut encore etre necessaire, lorsque la proteine 
recombinante selon 1' invention comporte plus d'une proteine 
d'interet fusionnees entre-ellee, que lesdites proteines 
d'interet puissent etre separees apres leur synthese, par 
exemple avant purification. Ainsi, il est possible 
d'inserer entre les differentes sequences d'ADN codant les 
differentes proteines d'interet, au moins une sequence 
d'ADN codant un site de clivage pour une endoprotease . II 
est possible que des sites de clivage pour des 
endonucleases differentes soient inseres dans une meme 
proteine recombinante . 

II peut etre necessaire de rendre le clivage de la 
proteine recombinante encore plus efficace. A cet egard il 
est possible d'inserer dans la construction selon 
1' invention une sequence codant une sequence peptidique 
servant de bras espaceur, pref erentiellement situe en amont 
du site de clivage par une endoprotease. 

Ainsi selon un mode de realisation particulier de 
1' invention, la proteine recombinante comprend en outre une 
sequence peptidique servant de bras espaceur 
preferentiellement situe en amont du site de clivage par 
une endoprotease. 

Des lors, dans une forme encore plus elaboree, la 
proteine recombinante de 1' invention comprend, de son 
extremite N-Terminale a son extremite C-Terminale, le 
fragment d'integrine alpha comportant un bras espaceur et 
le site de clivage par une endoprotease, la (ou les) 
proteine (s) d'interSt et le tag 6xHIS. 

Sous une forme particuliere, la proteine recombinante 
de 1' invention comprend, de son extremite N-Terminale a son 
extremite C-Terminale, le fragment d' integrine alpha 
comportant un bras espaceur, le site de clivage par le 
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facteur Xa, la (ou les) proteine (s) d' interet et le tag 
6xHIS. 

Sous une autre forme particuliere, la proteine 
recombinante de 1' invention comprend, de son extremite N- 
Terminale a son extremite C-Terminale, le fragment 
d'integrine alpha comportant un bras espaceur, le site de 
clivage par la thrombine, la (ou les) proteine (s) d' interet 
et le tag 6xHlS. 

Selon 1« invention, la sequence codant une sequence 
peptidique servant de bras espaceur peut Stre toute 
sequence connue de 1 -Homme du Metier permettant un 
espacement suffisant du site de clivage par une 
endoprotease et de la (ou des) proteine (s) d' interet pour 
que le clivage de la proteine recombinante soit eff icace. 

Preferentiellement, ladite sequence codant une 
sequence peptidique servant de bras espaceur est la 
sequence SEQ ID N°7 suivante : 

5' GACCCGGGTGGTGGTGGTGGTGGTGGTGGTGGT 3 ' codant la sequence 
peptidique SEQ ID N°8 suivante : 

20 DPGGGGGGGG. 

Ainsi, dans une forme des plus elaboree, la proteine 
recombinante de 1' invention comprend, de son extremite N- 
Terminale a son extremite C-Terminale, le fragment 
d'integrine alpha comportant un bras espaceur et le site de 
clivage par une endoprotease, la (ou les) proteine (s) 
d' interet, separees par un (ou des) sites de clivage par 
une endoprotease (par exemple le facteur Xa ou la 
thrombine) et le tag 6xHIS . 



15 



25 



30 L' invention a encore pour objet 1 ' utilisation d'au 

moins un fragment d'une sequence en nucleotides codant pour 
au moins un fragment d'une integrine alpha tel que defini 
precedemment, dans la construction d'une sequence en 
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nucleotides codant pour une proteine recombinante 
d' interet, telle que definie precedemment . 

L' invention a aussi pour objet 1 ' utilisation d'au 
moins un fragment d'une sequence en nucleotides codant pour 
5 au moins un fragment d'une integrine alpha tel que defini 
precedemment, pour la production d'une proteine 
recombinante d< interet telle que definie precedemment 

L' invention a en outre pour objet une sequence en 
nucleotides codant pour une proteine recombinante d' interet 
10 comprenant au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une 
xntegrine alpha, tel que defini precedemment, et une 
sequence en nucleotides codant pour au moins une proteine 
d'mteret, telle que definie precedemment. 
15 Preferentiellement, la sequence en nucleotides codant 

pour au moins un fragment d'une integrine alpha utilisable 
selon 1' invention ou comprise dans la sequence en 
nucleotides codant pour une proteine recombinante d' interet 
selon 1' invention, pent etre choisie parmi les sequences en 

<s0 nucleotides SEO id n°i qda tt-> 

*W i.u n 4, SEQ ID n°5 et SEQ ID N°6, de la 

liste de sequence fournie en annexe. 

L' invention a encore pour objet un vecteur comprenant 
une sequence en nucleotides codant pour une proteine 
recombinante d'interet, telle que definie precedemment, 

25 comprenant au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une 
xntegrine alpha et une sequence en nucleotides codant pour 
au moins une proteine d'interet. Le vecteur pent etre un 
vecteur eucaryote tel qu'un plasmide ou un virus. Le 

30 vecteur peut aussi etre tout vecteur procaryote tel qu'un 
plasmide ou un phage. 

De preference, le vecteur est un vecteur d' expression 
c'est-a-dire capable de permettre la transcription et la 
traduction de la sequence en nucleotides qu'il contient 
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A titre d'exemple, il est possible de citer les 
vecteurs de la famille pET vendu par la societe Novagen ou 
ceux de la famille pGEX vendus par la societe 
AmershamBiosciences . 
5 L' invention a encore pour objet une cellule dans 

laquelle une sequence en nucleotides codant pour une 
proteine recombinante d'interet, telle que definie 
precedemment, a ete introduite. Selon un mode particulier 
de 1' invention, la sequence a ete introduite sous la forme 
10 d'un vecteur tel que defini precedemment. 

Par cellule, on entend ici aussi bien une cellule 
eucaryote qu'une cellule procaryote, particulierement une 
bacterie. Toute bacterie capable de permettre 1' expression 
d'une proteine a partir d'une sequence en nucleotide peut 
15 etre utilisee selon l'invention. A titre d'exemple, il est 
possible de citer toutes les bacteries qui derivent de 
BL21, BL21 star, Rosetta, BLR, Origami, Tuner, Novablue, 
toute disponible commercial ement . 

L'invention a encore pour objet un procede de 
20 production d'au moins une proteine d'interet, caracterise 
en ce que dans une premiere etape on introduit dans une 
cellule une sequence en nucleotides codant pour une 
proteine recombinante d'interet telle que definie 
precedemment, et que dans une deuxieme etape on place la 
25 cellule dans des conditions suffisantes pour permettre 
1' expression de la proteine recombinante d'interet. 

Le procede de l'invention peut en outre comprendre une 
etape supplement a ire au cours de laquelle la proteine 
recombinante d'interet peut etre couple par action d'une 
30 endoprotease, (facteur Xa, thrombine, par exemple) , au site 
cree dans les derniers residua de 1 ' integrine afin de 
separer la proteine d' interet de son partenaire de fusion. 

Le procede de l'invention peut egalement comprendre 
une etape supplement aire au cours de laquelle la prot6ine 
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reccnbinante d'interet, ou la (ou les, prolines d-interet 
separeels, de son (de leurs, partenaire (s) de fusion, peut 
(peuvent) etre purifi« e ( 3 ) . 

Selon 1. precede de 1- invention, la sequence en 
nucleotides cedent pour une proteine recenbinante d'interet 
Peut-etre introduce dans la cellule par toute .ethode 
connue. A txtre d'exemple de methodes utilisables. il est 
possible de citer pour les cellules procaryotes, le choc 
theMlqUe ° U l, «^«roporation. Pour les cellmes 
eucaryotes, on peut citer 1 .electroporation, la .ethode du 
precxpxte au phosphate de calciu m , 1 ■ utilisation de 
polymeres cationiques tels que le DEAS-dextran ou enQore 
touts cathode utilisant des liposo.es cationiques ou del 

dendriraeres actives. On peut aussi utili*.-,- ^ « 

^ . ^ C1USS1 utiliser des retrovirus 

utxlisant des .aicroprojectiles pour delivrer de LAD* Ls 
des cellules cibles . 

De m8me , toute condition suffisante pernettant 

a : ::z o ; de " a prot4ine ^t^, comues 

1 inventTl ^ — * ™ - 

protr'T', tCUtS m " h0de ^ PUrlfi -"- ^ la (ou des, 

utl"see I" 8 ^ 1,h0n "" e ^ m6tl - »™ 

llSe , e Sel ° n 16 - 1'invention. A titre 

arfmxte, de chromatographie d'echange d'ions, de 
chro^atographie d> interaction hydrophobes ou encore de 
filtration sur tamis moleculaire . 

d-intrrrt 10 " 1 """' l0rSqU6 ^ Pr ° tSlne 

ll l 0 ^^ ^ 6XHIS ' 13 P-i"-tion sur 

colonne Ml cxel-acide nitrilotriacetique agarose (Ni -NTA, 

sTrr r: ra6thode de ,^^ t 

satxsfaxsante dans le cadre du proced* de 1- invention. 
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Les techniques utilisables selon 1 . invention sent 
connues de l-homme du metier. Celui-ci peut se referer aux 
nombreux manuels disponibles et en particulier a "Molecular 
Cloning, a laboratory manual. 2nd edition, Sambrook, 
Prxtsch, Maniatis eds . , CSH laboratory press, (1989)" 

Outre les dispositions qui precedent, 1' Invention 
comprend encore d'autres dispositions qui ressortiront de 
la description qui va suivre, qui se refere a des exemples 
de mxse en csuvre de P Invention ainsi qu'aux dessins 
annexes, dans lesquels ; 

La Figure 1 represente une construction correspondant 
a un vecteur selon !• invention. 

La Figure 2 represente la production de la proteine de 
fusxon rntegrine as-recepteur V2 de la vasopressins selon 
le precede de 1- invention (colonne de gauche , poids 
moleculaires des prolines de 1 ■ 6chantillon margueur , 
fleche , position de la proteine recombinants integrine 
as-recepteur V2 de la vasopressins, NI , prolines d'un 

20 !t a T." l0n n ° n - induit ' 2h ' » et 4h : proteines d . U n 
20 echantillon induit apres 2h, 3h et 4h d' induction, . 

La Figure 3 rspressnte la proteine recombinants 
mtsgrxne a5-recepteur V2 de la vasopressins de la figure 
2 apres purification et Migration s„r gel d ■ electrophone . 

colonne de gauche = poids moleculaires des proteines de 
1'echantrllon margusur ; fl 4o he , position ds la proteine 
rscombinants integrine OS-recepteur V2 de la vasopressins, 

La Figure 4 represente le rSsultat de la 
purification de la proteine recombinants de fusion 
rntsgrinsas-recepteur V2-recepteur CXCR4 (a 5 -V2-CXC R 4) par 
30 chromatographie d'af finite 

S6M: surnageant de solubilisar-i ~r, <- 

ouiUDiiisation en tampon 6M uree 

depose sur la resine Ni-NTA agarose 

FT: echantillon non retenu sur la resine 
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W: fraction wash contenant 15 mM imidazole 

E100: fusion purifiee eluee en tampon contenant 100 mM 

imidazole 

La fleche indique la position de la proteine de fusion 
CX5-V2-CXCR4. 
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Les exemples suivants sent illustratifs de 1 . Invention 
et ne la limitent aucunemenf 

Example 1 : Construction d'un vecteur permettant 
1 expression dans les bacteries d'une proteine recombinante 
d'inter§t : 

Un ADN complementers oodant pQur la proc4 . ne 

d xnteret que 1- on veut exprimer. est position**, dans le 
vecteur p ET21a (+) (vendu par ^ 

avec un fragment d' ADN complementaire de 1'integrine as 
par 1- utilisation de sites de restriction appropries. Le 
fragment de 1'integrxne «s est delimit* par les sites Ndel 

" BamHI - ^ NdeI 3 d'incorporer un codon 

ATG qux est le codon initiateur de la traduction. Ce codon 
xnxtxataur code pour une methionine ,„) . Le site HdeI 
constitu* par la sequence CATATG est done interessant pour 
sous-cloner un fragment d 1 ADN puisque la sequence cible se 
trouve directement en phase avec le codon ATG. Celui-oi 
constitue alors le residu X. En ce qui concerns 
alphas, 1 'ATG du site Ndel est positionne en amont de sa 
sequence nucleotidique. Dans ce cas, 1 'ATG codsra pour une 

T„ e \ le ° ^ 1,lnt * 3rine SS " le —i* Le fragment de 
287 resxdus sera couple a la methionine 1 et on obtxent 
done un partenaire de fusion de 288 r*sidus : M1-G286 

Le vecteur fournit directement la sequence cedent pour 
le tag SxHIS qui sera localise a 1-extremiti C-terminale de 
la proteine recombinante d'interSt. Un sits EcoRI est 
localise dans le vecteur du cote de 1'extrsmits N-terminale 
du site tag. Ainsi 1-ADN compl 4 mentaire codant pour la 
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proline „. interet est insSrS ^ ^ ^ ^ ^ 

1'extremite C-terminale du fragment d' ADN complementaire de 

l'xntegrine a5 et le aitP> w^^ot 

e Slte EcoRi situe du c6te de 
1' extremity N-terminale du tag 6xHIS. 

La figure 1 montre le schema d'une telle 
construction . 



Exemple 2 : Expression du recepteur V2 humain de la 
vasopressine : 

10 Construction du vecteur : 

L ' ADN complementaire du rScepteur V2 humain de la 
vasopressin (Cotte et a!., a. BIOL. chem. 273. 29462 . 

1998K " fc ^ — 1- sit es BamHI et EcoR du 
vecteur obtenu a 1' exemple 1. 

15 Etape 1 , Preparation de LADN complementaire du 

recepteur V2 humain de la vasopressine : 

restrict- "* reC ° nn * iSS — P«« 1- enzymes de 

restriction BamHI et EcoRI sent ajoutes de part et d.autre 

20 h S r SnCe ^ 1,ADN au recepteur V2 

20 humarn de la vasopressine. Cela est realise par la 
technic da PC R classigue. L 'ADN complementaire du 
recepteur v 2 humain de la vasopressine est ampli £14 . 

273 Lrr, veoteur pRK5 " v2 - <c ° tte et j - bi ° l - 

273. 2 9 4 6 2- 29468 , 1998) , » llaida de ^ oli90nuclSotides 

::ch r :;c s her: mettant d,inssrer ies — * 

oligo sens (permet 1 • incorporation du site BamHI) , 5 . 

° GC TCC ^ CTC ATG GCG TCC ACC ACT TCC 3 ■ 

oligo antisens (permet 1 . incorporation du site EcoRI, 
0 5 CGA COG AAT TCT GCG ATQ AAG TGT CCT TGG CCA G 3 1 

La reaction de PCR est realisee dans 50 microlitres 
d un melange reactionnel comprenant : 

" PRK5 " V2 20 ng 

- oligo sens 100 ng 
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- oligo antisens 100 ng 

- Pfu Turbo polymerase (Stratagene) 2.5 u 

- tampon Pf u 10X (Stratagene) 5 m 
dNTP 80 uM fi na i pour chacun des 4 

selon les parametres de cycle suivants . 

- denaturation initiale a 95-c pendant 2 minutes 
puis 



- 25 cycu, , 95 . c . 30 seconds* puis 5S . C , 1 minute _ 
1,5 minutes puis 
" - elongation finale a 72-Cpendant 10 minutes. 

amplify, est co „tr61ee sur ^ j% 

- v 2 Et ::; 1 Lie ) purification du «~ 

<ue purification Oiacrti-i^ir 
.... W quick Srel extraction kit 

(reference Qiacren 2ft7n*\ . 

orotmo „ , 9 28706), en suivant strictement le 
protocole preoonise par le fournisseur. 

Etape 3 = Coupure du fragment PCR V2 amplifi* par les 
enzymes BamHI et EcoRI . 

Oela est realise en une seule etape a Laide des 

incucation de 3 heures £ 170^ ,o„ 

25 miorWM- ' nS Un volum e final de 50 

microlitres contenant : 

- insert V2 (fragment amplify) 100 a 200 ng 24 ul 

- tampon EcoRI 10X NEB 5 ^ 

- serum albumine bovine NEB 100X (10 mg/ml) 1 U l 

- EcoRI ( 40 U ) 

30 « 2 ^ 1 

3U - BamHI ( 40 U ) 

2 |il 

- eau 

par cnauff" ^ r * a0tl ° n ' «"* ^inactivees 

par chauffage a 80°c. pendant 20 minutes. 
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Le fragment PCR V2 est alors purifiS a partir d-un gel 
d- agarose 1% selon le protocole decrit ci-dessus. 

Etape 3 : sous-clonage du fragment PCR V2 amplifie 
dans les sites BamHI et EcoRI du vecteur pET21a de 
5 l'exemple 1 : ^ 

La ligation est realist par incubation a temperature 

8,blante < 20 -""O pendant 4 heures dans un milieu 
comprenant : 

- fragment PCR V2 BamHI / EcoRI 

10 (100 a 200 ng) 0 , 

- vecteur pET21a (30 ng) 

coup<§ par BamHI / EcoRI 3 „ x 

- tampon ligase 10X (NEB) 2 5 ^1 

- T4 DNA ligase (NEB) 2 
15 - eau 

Le produit de ligation, proteine de £ ^slon 'integrine- 
recepteur V2 humain de la vasopressin, est ensuite utilise 
pour une transformation des bacteries Rosetta (DE3) afin de 
realxser les tests d- expression du recepteur 

introduction du vecteur depression dans une bacterie 
et expression de la proteine d'interet : 

Transformation : 

Le veoteur obtenu precedemment est ensuite introduit 
dans une bacterie de souche Rosetta (DE3) par la technique 
du choc thermigue en suivant le protocole de transformation 
preconxse par le fournisseur, en !• occurrence Novagen 

2 0 m de bacteries Rosetta (DE3) reference Novagen 
70954-4 et 1 m de pE T 21a-integrine/V2 (guelques 
nanogrammes, sent incubes sur glace 3 0 minutes, puis 
mamtenus a 42'c pendant 30 secondes et de nouveau sur 
glace pendant 2 minutes pour realiser un choc thermique 

80 m de milieu SOC (voir composition dans Molecular 
Cloning, a laboratory manual. 2nd edition, Sambrook, 
Frrtsch, Maniatis eds. CSH laboratory press, „„, sont 
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alors ajoutes, puis est inoubs , ^ ^ 

heure sous agitation a 300 tours/minutes . * 

_ L. miiieu d. incubation est alors Stale sur boit e s de 
Petri contenant du mi lieu LB agar + ampicilUne 

microgrammes / ml. Les boites fi o^ • 

ooxces sont incubees a 37°c 16 

heures^ L es oacteries d.une colonic sont alors cultivees a 
3 C dans xo 1 de m i lieu LB contenant 100 mM1 
a'a m picilline ,ou de son analogue la carbenioinine, . eTla 
suspension cellulaire est agitee a 300 toure/ m i„utes 
Expression de la proteine : 

Lorsque Xa densite optique de la culture attaint 0.6 

Lit r S10n ^ 13 Pr0t * lne est induite par 

addition d'IPTG 1 mM. 

Des echantillons sont prSleves 2 3 ™, a ^ 
induction. Pour cela l ml „ aPrSs 
densits suspension bacterienne, 4 

"Inantil 'T* ^ °' S ' ^ ^ture. 

tours " —rifuge pendant 2 mln utes a 1200 0 

tours par .mutes. Le surnageant est ali m ine at le oulot 
«t resuspendu dans 60 ,1 de ta m pon de l ys e (25 ^ Tris , 

pee 3. iss *. glycine , 0 , 1% SDS) 60 de - 

PH 6,5, 8* S DS , bleu de brcophenol (quelques grains,) sont 
alors a 30ut4s et 10 ^ de lys4 

proteigues tot.™, sont alors deposes sur gel 
* d acryla.rde/bis-acryla^de 1 2% . SDS 0 . x % . ^ 
migration des prolines, elles sont colorees au ble! 2 
Coomassie selon les techniques habituelles 

ecba„ L t a iir 9Ure 2 rePr4Sente l " resultats obtenus. Le s 

IZTs :Z ladUltS S ° nt C ° mParSS * *» non 
induits MI) ma is ayant ate cultlvSs pendant un 

equivalent. XI est Evident que la proline de rusion X 

recepteur V 2 , qui presente un poids „oleculaire apparent 

: Tbi: 5 ^' oonstitue - aee ~~ 

bacterie, ce qui est una condition requise pour une 
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purification du recepteur en ,uantite compatible avec dee 
analyse de 3a ^ ^ apprQches ^ 

cristallographie ou rmh. 

1 ml -de culture ainei realisee a permis d'obtenir 
= environ 3 ^ de receptee de la vasopressin. 

Sample 3 = Expression d-autres receptees • 

la mS L l rS ? f ltat 0btSnU * 1,SXemPlS 2 * «" ~produit avec 
la meme effrcacite, pour d'autres RCPGs. tela cue le 

recepteur P 3 -adrenergic, les receptees BLT 2 cLT T1 et 
10 Cys-LT2 dee leucotrienes LTB4, LTD4 et LTC4 1 

cannabinoide de type 1, ie recepteur via de l' ^ 

et le recepteur de I- ocytocin, vasopressin 
Example 4 : Purification de la orotSin- s * 

fragment d.integrine «s- recepteur V2 de ! 
15 obtenu a 1' example 2 , 

eoljT m ! th0de UtillS#e CSlle dS « ite P~ X«th J et ■ 

collaborates*. (Metal chelate affinity chromatography a 
new approach to protein r*m~n . ■ tograpny, a 

1975) fractionation. Nature 258, 598-599, 

20 purifil™ d eXPOSS m * - 

Lterienne Z * Z ^ * — « — — 

une colonie isolee sur LB agar + Ampicilline ,100 pg / 
est p.guee et cultivee dans 10 ml de milieu de culture 
5 LB + carbenicilline (loo uo / „l i , , culture 
a 37»c • ' • ** culture est realisee 

Leite lt S S9X H tlOD * tOU " P " mlnUte - la 

arret*! T " dt ™ 0... X. culture est 

arret t 4e au ref ^ st 

o :r 0 p ::°d u *t • Le iendemain - dans - - 

mj., xoo ml de milieu de culhnra tt» 

/ m1 4 fc culture LB + carbenicilline (100 uq 

/ ml) sont ensemences avec 2 ml Ho ~ - n W 
37 o c a 30 n Preculture et laisse 

37 C, a 300 tours par minute jusqu'a ce que la densite 
opt lque de la culture ait attaint 0,.. o.l - 
alors Routes a la culture afin d-induire LexpressLn de 
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la proline reconfcinante . La culture est pcureuivie environ 
heures lus^a obtention d-un densite optigue de 2,4 
(facteur de stimulation de 4). 

La culture est alors centrifuge a 4000 tours par 

IT ~ 5 minUteS ' LS * et le 

culot pent etre lyse directement ou conserve a -80-c 

a laTnatt 'T' ^ ^ P " h <~eisatio„ 

6 ^ ^ Tris "HCl 20 mM, p H 8,00 + 
xnnxbrteurs de proteases <leupeptine 5 M / ml ! 
X0 benzidine 10 p 9 / ml et PMSF „ ug ™ ' ^ ' 

,nn lbl teurs de proteases seront incorpores a tons Tee 
tampons utilises par la suite. 
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L es bacteries sont lysees par sonication a Laide 
d'une microsonde conioue B r » n =™ 

control 5 - Branson (duty cycle E0%, output 

secondes 1 *«•"= *" -•«»*, pendant 3 0 

nr: repos 30 seoondes ce ° ycie « 

rois) • Le tube est conserve da^c i , 

unserve dans la glace pendant la 

sonication. Le milieu PHt - i la 

minute i n.n rS centrif ^- Pendant 30 

f tOUrS ^ minUtS * 4 ° C - Le -rnageant est 

conserve pour contr61e sur gel d . electrophorese 

Le culot contient la proteine d-interet puisque celle 
C1 est -cumulee en corps d- inclusion. 

Le culot est repris par homogeneisation a la pipette 
dans 5 ml de Tris-HCI on m M TT „ pipette 
Tns HC1 20 mM, p H 8,00. Les etapes de lyse et 
de centrxfugation sont repStees une fois 

Les surnageants des centrif ugations sont conserves 
pour contraie sur gel d - electrophorese . " 

Le culot est repris par homogeneisation a la pipette 
dans 5 ml de Tris-HCI r>H n nn - Pipette 
est t>l a o* a ' UrSe Un barr ^ aimante 

est place dans 1 - echantillon et celui-ci est agite 
do_ pendant lh 30. Le tuhe est conserve dans la gla e 
P ndant cette etape qui correspond , un 

I ZZl? " PSrmet d " liminSr -mhranairL 
ou cytoplasmxgues associees aux corps d- inclusion mais gui 
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sent considerees comme contaminates par rapport a la 
proteine recombinante . 

L'ensemble est aiors centrifuge a 15000 tour, par 
mrnute pendant 30 minutes a 4 . c . Le surnageant 
5 pour eontraie sur gel <!• electrophone. 

nrot- Af±n / e SOlUbill8er les °«P- - inclusion et done la 

sol o 17 5 ^ de Tris - HC1 20 * H 8 '°°' — «. 

10 un barreau ai m ante est place dans 1 . ecnantillon et 

glace 1 ." 01 ^ ^""^ 3 >™- — ^ 

La proteine d.interet (le proteine de fusion fragment 
d'mtegrine a5-r«cepteur V2 d. l» ,„ . =gn>ent 

F v-i ae la vasopressins est alors 

15 complitement dSnaturSe. 

.-ensemble est alors centrifuge a 15000 tours par 
minute pendant 30 minutes » 4»r r- 

4 C - Le surnageant contient la 
proterne d.interet et constitue 1 . ecnantillon gui sera mis 

20 Hi-TT aveo 13 rssine Ni - OTA 

cl t ^ PUriflSr ^ fUSi ° n -lP-*-va par 

chromatographie d'af finite. 

30430, "son? - r * Si r, a9ar ° Se SUPerfl ° W ( «—».' *- 
30430, sent equrlibres dans du Tris-HCl 20 a*, pH , oo 

uree „. SDS 0<2% , MaC1 „ ( ^ ^ On r a ^te 

2 5 dans l.ecbantiUon contenant la proteine d^nteret 1 
quanta suffisante de NaCl et d- imidazole pour obtenir 21 
concentration finale de 150 mM de NaC1 -t ^ « 

e lm on a r le - L ' SChantill0n « * — ~* mis en contact 
et on laxsse xncuber a 4«c pendant 16 heures et sous 
30 agrtation douce. L e flange ecnantillon/resine est depo s6 
aans une colonne plastigue. On laisse Apres la decanted 
la fraction >f lowtnrougV est recuperee » un debit fain"' 
pour contraie sur gel d'Slectrophortse. 
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I* resine est alors lavee avec 3 x 9 ml d . une solution 
de Tris-HCl 20 m. p„ 8 ,oo, uree m , SDS 0.2*, NaCl 150 m. 
lm ida Z ole 20 m . pour eli„,iner tout es les protsines nQn 
retenues de facon specif igue sur les groupements Nickel. 
. Les eluats de lavage sent conserves pour contrSle sur gel 
d 1 electrophordse . 

La proteine d- intent est alors detachee de la res ine 
par pass de 3 ml d , une soiut . on ^ Tris _ Hci 2q ^ 

8 00, uree 6M, SDS 0,2%, NaCl 150 mM, imida2ole 100 ^ Un 
aliquot de la proteine purifiee est conserve pour contr61e 
sur gel d- electrophorese . 

10 Ul du milieu contenant- i =, r^~«--- 

ant la P r oteme purifiee sont 
melanges a 10 ,1 de tampon de dep6t au SDS et 
est depose sur un gel d • electrophorese . 

10 HI d-echantillon purifie contiennent de 5 a 10 u g 
de proteine soit dans 3 ml d'eluat, l /5 a 3 mg de proteine 
recombinante. P Ceine 

g- ;iier:; h o 3 reir re ia prot4ine pu — — - 

L'echantillon purifie est- Hiai,,^ 
. m . y 16 est dla lyse centre une solution 

de Tris-HCl 20 mM d h a nn 

. , ' PH 8 ' 00 ' uree «M, NaCl 150 mM pour 

eliminer le SDS p>t- i h m jj, , ^ 
est „ "UdMole. Pour cela, 1 ■ eehanttllon 

11 t 7 " ^ dialySS ^ £alt - lecher 

contenant un Ixtre du tampon. L a dialvse est effectuee a 
4 c pendant au moins 24 heures. 

d-i f . L ,' S ; i hantill0n est recupere et la guantite de proteine 
d.xnteret obtenue est dosee par m esure d. absorption 



Cexcxtatron a 280 nM, absorption entre 235 et 500 nM, . En 
30 general, on obtient une D.o de ! » x . s< ce q J es " 
equivalent a une concentration de 0.5 a 1 „, , ^ ce ^ 
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dans ^ , Pr ! tSina PUr " iSe et «»*«.. (oar solubilisSe 
dans Lu.ee «, est util±s4e pour 

renaturation. ae 

Exe-pie 5 , construction d'un vecteur per m ettant 
■ 1'expressxon si m uitanee ae deux prolines d . ln ^ rg ^ 

e dans le vecteur pET21a (+) -«svp 

par exemple , restriction Sad et Hind!!! 

LdanrXJr it ^TL^ x" "~ 

i-extre.it, c-te ra ina!e du ^T^T 

done sa purification dans une etape ulterieure Per, " ettra 

Dans l'exemple 
U baetteiaH.- i I version optimisee 

m • i CXCR4 est mseree dans le vecteur 

t He reported ^^^T ^ rT h0 " 0l ° 9 * 
and activation, dna Ceil sic! \T 465 47 f "* bina1 " 9 
43 aie m ent etre utiiis.e de ia m6m e f aco n *** 

Etape 1 : Preparation de 1 ' ADN co m plementair» „ 
recepteur CXCR4 humain. "Plamentarre du 

Des sites de reconnaissance oo„r -i. 
restriction Sac! et HindlTT . enzymes de 

acI et Hind!!! sont ajoutes de part et d' autre 

ce recepteur est "nl ^\ ' de 
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Oligo sens (incorporation du site SacI) : 5' 
CGAGCTAAGGC GAGCTC A ATGGAAGGCATTAGCATTTATAC 3' 

Oligo antisens (incorporation du site Hindlll) : 5 ' 
CGACGGCCC AAGCTT GCTGCTATGAAAGCTGCTGCTTTC 3' 
5 La reaction de PCR est r§alis6e dans 50 microlitres et 

est composle de : 

pETlOl/D-TOPO 20 ng 

Oligo sens 100 ng 

Oligo antisens 100 ng 

10 Pfu Turbo polymerase (Stratagene) 2.5 U 

Tampon Pfu 10 X 5 jllI 

dNTP 80 JIM final pour chacun des 4 
Les parametres de la reaction sont : 

denaturation initiale k 95°C pendant 2 minutes puis 25 
15 cycles : 95°C, 30 s ; 55°C, 1 min ; 72°C, 1.5 min puis 
elongation finale a 72°C, 10 min. 

La presence du fragment amplifiS est vgrifiee sur gel 
d' agarose 1%. 



2 0 Etape 2 : purification du fragment amplifie 

La zone du gel d' agarose dans laquelle on visualise le 
fragment d'ADN amplifie est decoupee et l'ADNc est purifie 
& l'aide du kit de purification Qiaquick gel extraction 
(Qiagen reference 28706) en suivant strictement le 

25 protocole preconise par le foumisseur. 



Etape 3 : coupure du fragment PCR CXCR4 amplifi6 par 
SacI et Hindi I I 

Cela est realise en deux reactions successives a 
30 l'aide d' enzymes de restriction vendues par NEB Biolabs au 
cours d' incubation & 37°C. 

l dre reaction pendant 3h: 

fragment PCR 500 ng 

tampon NEB 1 10X 5 (II 
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serum albumine bovine (BSA) x 
SacI 

40 U 

EaU qSp 50 HI 

Le fragment PGR amplify e t coupe par SacI est purif ie 
a partir d'un gel agarose salon le protocole decrit a 
l'etape 2. 



10 



15 



20 



25 



30 



2 me reaction pendant 3h : 

fragment PGR recupere de la reaction precedente 

tampon NEB 2 10X 5 (4.1 

BSA 

1 111 

Hindi I I 

40 U 

Eau qsp 

Le fragment PCR amplif ie et coupe par SacI ^ Hindlll 
est purif ie a partir d'un gel d' agarose selon le protocole 
decrxt a l'etape 2. 

Etape 4 , sous-clonage du fragment PCR CXCR4 amplifies 
et coupe Sad / Hindlll dans le vecteur pET21a ( + ) -0C5V2 

Cette etape est realisee par ligation a temperature 
ambiante pendant 16H00. 

Fragment PCR coupe 200 ng 
Vecteur pET2 la ( + ) -CC5V2 

coupS par les memes enzymes 50 ng 

Tampon ligase 10X (NEB) 2 . 5 p.1 

T4 DNA ligase (NEB) 2 2 

E3U qSP 25 m 

Le vecteur obtenu qui code pour une triple proteine de 
fusxon integrine-recepteur V2-recepteur CXCR4 , est ensuite 
utxlxse pour une transformation des bacteries Rosetta (DE3) 
dans le but d'exprimer cette fusion et de la purifier. 

Etape 5 : transformation des bacteries Rosetta. 
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Suivre a la lettre le protocols decrit dans 1'exemple 
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15 



Etape 6 ; expression de la fusion (X5V2-CXCR4 

Suivre a la lettre le protooole decrit dans 1'exemple 

LTb le „ mllieU de CUltUre LB "<= —Place par du m ilieu 
Hyperbroth (fit nena En zym e System, et le temps optimum 
d induction est de 4 heures. 

Etape 7 = purification de la fusion a5V2-cxc R 4. Cette 
etape est illustree par la figure 4 

lors de 1- etape de lavage de la resine Ni-KTA agarose une 

concentration de 15 mM d- Imidazole au lieu de 20 1 ! 
nf.i . , j ueu ae 20 mM est 

r .. « : soiution de iavage - L,siuti - -<= — »— 

a 100 mM comme dans 1'exemple 4. 

du sit T S ^ PaCSUr S9alement Stre - —* 

EcoRl * ^ thr0mbinS jUSte I**- 1- Bite 
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REVEND I CATIONS 

1) Utilisation d'au moins un fragment d'une integrine 
alpha pour la production dans une cellule, a 1' exception 

5 d'une cellule de mammif eres , d'au moins une proteine 
recombinante d'interit. 

2) Utilisation selon la revendication 1, caracterisee 
en ce que la cellule est une cellule procaryote, 

10 particulierement une bacterie. 

3 (Utilisation selon l'une quelconque des 
revendications 1 ou 2, caracterisee en ce que le fragment 
d' integrine alpha est une sequence en acide's amines 

15 complete de 1' integrine alpha ou une sequence partielle; 

4 (Utilisation selon l'une quelconque des 
revendications 1 a 3, caracterisee en ce que le fragment 
d' integrine alpha est une sequence comprenant l'extremite 

20 N-terminale de 1' integrine alpha utilisee. 

5 (Utilisation selon l'une quelconque des 
revendications 1 a 4, caracterisee en ce que 1' integrine 
alpha est native ou mutee. 

25 

6 JUtilisation selon l'une quelconque des 
revendications 1 a 5, caracterisee en ce que le fragment 
d' integrine alpha comprend au moins les modules FG-GAP IV a 
VII et une portion du module FG-GAP III de 1' integrine 

30 alpha utilisee. 

7 (Utilisation selon l'une quelconque des 
revendications 1 k 6, caracterisee en ce que le fragment 
d' integrine alpha provient d'une integrine alpha choisie 
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parmi les integrines otl, oc2, a3, a4, as, oc6, a7 , a8 , a9, 
alO, all, aD, aE, aL, aM, ax, allb f ou encore av. 

8) Utilisation selon la revendication 7, caracterisee 
5 en ce que le fragment d' integrine alpha provient d'une 

integrine alpha choisie parmi les integrines 0C5 , aV ou 
allb. 

9) Utilisation selon la revendication 8, caracterisee 
10 en ce que le fragment de 1 1 integrine alpha 5 s'£tend entre 

les positions 231 et 517 (en tenant compte de la presence 
du peptide signal) ou des positions 190 a 476 (en ne tenant 
pas compte de la presence du peptide signal) . 

15 1 0 ) Utilisation selon la revendication 8, 

caracterisee en ce que le fragment de 1 1 integrine aV 
s'etend entre les positions 211 et 495 (en tenant compte de 
la presence du peptide signal) ou des positions 181 a 465 
(en ne tenant pas compte de la presence du peptide signal) . 

20 

1 1 ) Utilisation selon la revendication 8, 
caracterisee en ce que le fragment de 1 1 integrine ailb 
s'etend entre les positions 224 et 508 (en tenant compte de 
la presence du peptide signal) ou des positions 193 a 

25 

12) Utilisation selon 1 ' une quelconque des 
revendications 1 a 11, caract<Sris6e en ce que le fragment 
d' integrine alpha comprend au moins une sequence en acides 
amines choisie parmi les sequences SEQ ID n°l, SEQ ID n°2 

30 et SEQ ID N°3 de la liste de sequence foumie en annexe. 

13) Utilisation selon 1 ' une quelconque des 
revendications 1 a 12, caracterisee en ce que le fragment 
d' integrine alpha comprend au moins une sequence en acides 
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amines codee par l'une des sequences en nucleotides choisie 
parmi les sequences SEQ ID n°4, SEQ ID n°5 et SEQ ID N°6, de 
la liste de sequence fournie en annexe. 

1 4 ) Utilisation selon l'une quelconque des 
revendications 1 a 13, caracterisee en ce que le fragment 
d'integrine alpha est situe dans la (ou les) proteine (s) 
recombinante(s) d' interet preparee(s) selon 1' invention, en 
amont de la (ou des) sequence (s) de la (ou des) proteine (s) 
d' interet que l'on vise a produire. 

1 5 ) Utilisation selon l'une quelconque des 
revendications 1 a 14 , caracterisee en ce que la (ou les) 
proteine (s) recombinante (s) comprend (comprennent) au moins 
un site de clivage par une endoprotease . 



1 6 ) Utilisation selon l'une quelconque des 
revendications 1 a 15, caracterisee en ce que la (ou les) 
proteine (s) recombinante (s) comprend (comprennent) au moins 
20 un bras espaceur. 

1 7 ) Utilisation selon la revendicat ion 16, 
caracterisee en ce que le bras espaceur est constitue par 
la sequence peptidique SEQ ID N°8 de la liste de sequence 
25 fournie en annexe. 

l 8 ) Utilisation selon la revendicat ion 16, 
caracterisee en ce que la proteine recombinante comprend au 
moins un bras espaceur code par la sequence en acide 
30 nucleique SEQ ID N°7 de la liste de sequence fournie en 
annexe . 



19) Proteine recombinante caracterisee en ce qu'elle 
comprend au moins un fragment d'une integrine alpha tel que 
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5 



decrit dans l'une quelconque des revendicat ions 1 ft 14 et 
au moins une proteine membranaire d'interet. 

20) Proteine recombinante selon la revendication 19 
caracterisee en ce que la proteine d' interSt est un 
recepteur couple aux prot6ines G. 
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15 



20 



25 



30 



21) Proteine recombinante selon la revendication 20, 
caracterisee en ce que le un recepteur couple aux proteines 
G est choisi parmi les recepteurs de la vasopressine et de 
l'ocytocine (Via, V2, OTR) , les recepteurs des leucotrienes 
(BLTl, BLT2, CysLTl, CysLT2) , les recepteurs adrenergics 
(beta .3), les recepteurs canabinoides (CBl) , les recepteurs 
des chimiokines (CCR5 , CXCR4 ) le recepteur ATI de 
1' angiotensin II, le r6cepteur B2 de la bradykinine. 

22) Proteine recombinante selon l'une quelconque des 
revendications 19 a 21, caracterisee en ce qu'elle comprend 
au moins une sequence de 6 residus histidine (tag SxHIS) . 

23) Proteine recombinante selon la revendication 22, 
caract6risee en ce que la sequence de 6 residus histidine 
est a l'extremite C-terminale de la proteine. 

24) Utilisation d'au moins un fragment d'une sequence 
en nucleotides codant pour au moins un fragment d'une 
integrine alpha tel que decrit dans l'une quelconque des 
revendications 1 a 14 , dans la construction d'une sequence 
en nucleotides codant pour au moins une proteine 
recombinante d'interet telle que decrite dans l'une 
quelconque des revendications 19 a 23. 
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20 



25) Sequence en nucleotides codant pour au moins one 
proteine recombinante d'interet telle que decrite dans 
l'une quelconque des revendications 19 a 23 . 

26) Vecteur comprenant une sequence en nucleotides 
telle que decrite a la revendication 25. 

27) Cellule, a 1 ' exception d ■ une cellule de 
mammiferes, dans laquelle une sequence en nucleotides telle 
que decrite a la revendication 25 ou un vecteur tel que 
decnt a la revendication 26 a ete introduit . 

d , int ! 8 ' PrOC ' d ' ^ Pr0dUGtion *'*u -ins une proteine 
d xnteret, caracterise en ce que dans une premiere etape on 
xntroduxt dans une cellule, a ^exception d-une cellule de 
mammxferes, une sequence en nucleotides codant pour au 
moms une proteine recombinante d'interet, telle que 
decree a la revendication 25, et que dans une deuxieme 
etape on place la cellule dans des conditions permettant 
1 expressxon de la (ou des) proteine (s) recombinante (s) 
d' xnteret. 



29) Proc4d 4 selon la revendication 28, caracterise en 
ce qu'il comporte en outre auppl4menta . re 

cours de laquelle la ,ou les, proteine ,., recombinants (s, 
d xnteret est (sont) coupee(s) par action d-une 
endoprotease . 



30 



30) Precede selon 1-une quelconque des revendications 
2B ou 29, caracterise en ce qu-il comporte en outre une 
etape supplemental au cours de laquelle la (ou les) 
prot«ine(s) recombinante (s) d-interSt ou la ,ou les) 
proteine(s) d-interet separee(s) de son (leurs, 
partenair e( s) de fusion, est (sont) purifi«e(s). 
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Figure 1 
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Figure 3 
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SEQUENCE LISTING 

<110> INSERM 
CNRS 

<120> Precede de production d'une protelne recombinante d'lnteret et proteine produite. 
<130> 32412/PCT 

<140> PCT/FR04/XXXXX 
<141> 2004-06-18 

<150> FR03/07411 
<151> 2003-06-19 

<160> 6 

<170> Patentin version 3.1 

<210> 1 

<211> 288 

<212> prt 

<213> Homo sapiens 



<400> l 

? et Gly Gin He Leu ser Ala Thr Gin Glu Gin He Ala Glu ser Tyr 

10 15 

Tyr p to 61 „ Tyr Leu „. Asn Leu 01n 61y c1n ^ T|)r 

30 

Gin Ala ser ser n. Tyr Asp jsp ser Tyr ueu Gly Tyr ser val Ala 
val Gly Glu Phe ser Gly Asp T „ r alu Asp ^ wi au wi 

J™ Lys Gly «„ uau %r ^ Gly Typ va , ^ s ^ 

/5 80 
Asp He Ar 9 ser Leu Tyr Asn Ph. ser sly Glu sln Met Ala Sep 

>he Gly Tyr Ala val Ala Ala Thr «p val as„ Gly Asp Gly Leu Asp 

ASP Leu Leu val G!y Ala Pro ueu Leu «e t Asp Ar 9 Thr Pro Asp Gly 

Aro Pro Gin G!u val Gly gj val Tyr val Tyr Leu Gin „1s Pro Ala 

& He Glu Pro Thr Pro Thr Leu Thr Leu Thr Gly „1 S Asp Glu Phe 

155 160 
«ly Ar 9 Ph, Gly ser Ser Leu Thr Pro Leu Gly Asp Leu Asp Gl„ Asp 



185 1/6 190 
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Gin Gly Val Val Phe Val Phe Pro Gly Gly pro Gly Gly Leu Glv ser 
195 200 205 

Lys Pro ser Gin val Leu Gin Pro Leu Trp Ala Ala Ser His Thr Pro 
210 215 220 

Asp Phe Phe Gly ser Ala Leu Arg Gly Gly Arg Asp Leu Asp Gly Asn 
"5 230 235 240 

Gly Tyr Pro Asp Leu He val Gly ser Phe Gly val Asp Lys Ala Val 
245 250 255 

Val Tyr Arg Gly Arg Pro He Val Ser Ala ser Ala Ser Leu Thr He 
260 265 270 

Phe Pro Ala Met Phe Asn Pro Glu Glu Arg ser Cys Ser Leu Glu Glv 
275 280 " 285 

<210> 2 

<211> 286 

<212> PRT 

<213> Homo sapiens 

<400> 2 

Met Gly Gin Leu lie Ser Asp Gin Val Ala Glu He val ser Lys Tyr 
1 5 10 15 

Asp Pro Asn val Tyr ser lie Lys Tyr Asn Asn Gin Leu Ala Thr Arq 
20 25 30 

Thr Ala Gin Ala He Phe Asp Asp ser Tyr Leu Gly Tyr ser Val Ala 
35 40 45 

val Gly Asp Phe Asn Gly Asp Gly He Asp Asp Phe Val ser Gly val 
50 55 60 

Pro Arg Ala Ala Arg Thr Leu Gly Met Val Tyr lie Tyr Asp Gly Lys 
65 70 75 gQ 

Asn Met ser Ser Leu Tyr Asn Phe Thr Gly Glu Gin Met Ala Ala Tyr 
85 90 95 

Phe Gly Phe ser Val Ala Ala Thr Asp He Asn Gly Asp Asp Tyr Ala 
100 105 110 

Asp Val Phe He Gly Ala Pro Leu Phe Met Asp Arg Gly ser Asp Gly 
115 120 125 

Lys Leu Gin Glu val Gly Gin Val Ser val Ser Leu Gin Arg Ala Ser 
130 135 140 
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8? ASP Phe Gln Thr T6o LyS Leu Asn Gly ffe Glu v al Phe Ala Arg 

■" u 155 16 g 

Phe Gly ser Ala lie Ala Pro Leu Gly Asg Leu Asp Gin Asp Gly^ Phe 

Asn Asp He Ala He Ala Ala Pro Tyr Gly Gly Glu Asp Lys Lys Gly 

190 

Ile Val Jg I1e Phe Asn G1 V jrg ser Thr Gly Leu Asn Ala val Pro 

ser Gin lie Leu Glu Gly Gin Trp Ala Ala Arg ser Met Pro Pro ser 

^-L-> 220 

Phe Gly Tyr ser Met Lys Gly Ala Thr Asp lie Asp Lys Asn Gly Tyr 

235 240 

Pro Asp Leu ile val Gly Ala Phe Gly val Asp Arg Ala lie Leu Tyr 

250 255 

Arg Ala Arg Pro val He Thr val Asn Ala Gly Leu Glu Val Tyr Pro. 

265 yyn 



ser He Leu Asn Gin Asp Asn Lys Thr Cys Ser Leu Pro Gly 

* ' 280 n ~ 



270 

285 



<210> 3 

<211> 286 

<212> prt 

<213> Homo sapiens 

<400> 3 



Met Gly Leu Leu Ala Gin Ala Pro val Ala Asp He Phe Ser ser Tyr 

10 15 

Arg Pro Gly lie Leu Leu Trp His val Ser ser Gin ser Leu ser Phe 
* u 25 30 

Asp ser ser Asn Pro Glu Tyr Phe Asp Gly Tyr Trp Gly Tyr ser val 
Ala val Gly Glu Phe Asp Gly Asp Leu Asn Thr Thr Glu Tyr val val 



60 



Gly Ala Pro Thr Trp ser Trp Thr Leu Gly Ala val Glu He Leu Asp 



80 



ser Tyr Tyr Gin Arg Leu His Arg Leu Arg Ala Glu Gin Met Ala Ser 

90 95 

Tyr Phe Gly His Ser val Ala Val Thr Asp val Asn Gly Asp Gly Arg 
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100 10 5 110 

His Asp Leu Leu val Gly Ala Pro Leu Tyr Met Glu ser Arg Ala Asp 

Arg Lys Leu Ala Glu Val Gly Arg val Tyr Leu Phe Leu Gin Pro Arg 

Gly Pro His Ala Leu Gly Ala Pro ser Leu Leu Leu Thr Gly Thr Gin 

155 160 

Leu Tyr Gly Arg Phe Gly ser Ala He Ala Pro Leu Gly Asp Leu Asp 

Arg Asp Gly T yr Asn Asp He Ala val Ala Ala Pro Tyr Gig Gly Pro 

ser Gly Ara Gly Gin Val Leu Val Phe Leu Gly Gin Ser Glu Gly Leu 

205 

Arg ser Arg Pro ser Gin val Leu Asp ser Pro Phe Pro Thr Gly ser 

" 5 220 

Ala Phe Gly Phe ser Leu Arg Gly Ala Val Asp He Asp Asp Asn Gly 

235 240 

Tyr Pro Asp Leu lie val Gly Ala Tyr Gly Ala Asn Gin val Ala val 

250 255 

Tyr Arg Ala Gin Pro Val val Lys Ala Ser val Gin Leu Leu val Gin 

265 270 

Asp ser Leu Asn Pro Ala val Lys ser cys val Leu Pro Gin 

280 285 

<210> 4 

<211> 864 

<212> DNA 

<213> Homo sapiens 

<400> 4 

atgggccaga tcctgtctgc cactcaggag cagattgcag aatcttatta ccccgagtac 60 
ctgatcaacc tggttcaggg gcagctgcag actcgccagg ccagttccat ctatgatgac 120 
agctacctag gatactctgt ggctgttggt gaattcagtg gtgatgacac agaagacttt 180 
gttgctggtg tgcccaaagg gaacctcact tacggctatg tcaccatcct taatggctca 
gacattcgat ccctctacaa cttctcaggg gaacagatgg cctcctactt tggctatgca 
gtggccgcca cagacgtcaa tggggacggg ctggatgact tgctggtggg ggcacccctg 
ctcatggatc ggacccctga cgggcggcct caggaggtgg gcagggtcta cgtctacctg 
cagcacccag ccggcataga gcccacgccc acccttaccc tcactggcca tgatgagttt 



240 
300 
360 
420 
480 
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<210> 6 

<211> 858 

<212> DNA 

<213> Homo sapiens 



540 
600 
660 
720 
780 
840 
864 



ggccgatttg gcagctcctt gacccccctg ggggacctgg accaggatgg ctacaatgat 
gtggccatcg gggctccctt tggtggggag acccagcagg gagtagtgtt tgtatttcct 
gggggcccag gagggctggg ctctaagcct tcccaggttc tgcagcccct gtgggcagcc 
agccacaccc cagacttctt tggctctgcc cttcgaggag gccgagacct ggatggcaat 
ggatatcctg atctgattgt ggggtccttt ggtgtggaca aggctgtggt atacaggggc 
cgccccatcg tgtccgctag tgcctccctc accatcttcc ccgccatgtt caacccagag 
gagcggagct gcagcttaga gggg 

<210> 5 

<211> 858 

<212> DNA 

<213> Homo sapiens 

<400> 5 

atgggtcagc ttatttcgga tcaagtggca gaaatcgtat ctaaatacga ccccaatgtt 
tacagcatca agtataataa ccaattagca actcggactg cacaagctat ttttgatgac 
agctatttgg gttattctgt ggctgtcgga gatttcaatg gtgatggcat agatgacttt 180 
gtttcaggag ttccaagagc agcaaggact ttgggaatgg tttatattta tgatgggaag 
aacatgtcct ccttatacaa ttttactggc gagcagatgg ctgcatattt cggattttct 
gtagctgcca ctgacattaa tggagatgat tatgcagatg tgtttattgg agcacctctc 
ttcatggatc gtggctctga tggcaaactc caagaggtgg ggcaggtctc agtgtctcta 420 
cagagagctt caggagactt ccagacgaca aagctgaatg gatttgaggt ctttgcacgg 
tttggcagtg ccatagctcc tttgggagat ctggaccagg atggtttcaa tgatattgca 
attgctgctc catatggggg tgaagataaa aaaggaattg tttatatctt caatggaaga ww 
tcaacaggct tgaacgcagt cccatctcaa atccttgaag ggcagtgggc tgctcgaagc 660 
atgccaccaa gctttggcta ttcaatgaaa ggagccacag atatagacaa aaatggatat 
ccagacttaa ttgtaggagc ttttggtgta gatcgagcta tcttatacag ggccagacca 
gttatcactg taaatgctgg tcttgaagtg taccctagca ttttaaatca agacaataaa 
acctgctcac tgcctgga 



60 
120 



240 
300 
360 



480 
540 
600 



720 
780 
840 
858 



60 



<400> 6 

atgggtctcc tggcccaggc tccagttgcg gatattttct cgagttaccg cccaggcatc 
cttttgtggc acgtgtcctc ccagagcctc tcctttgact ccagcaaccc agagtacttc 120 
gacggctact gggggtactc ggtggccgtg ggcgagttcg acggggatct caacactaca 180 
gaatatgtcg tcggtgcccc cacttggagc tggaccctgg gagcggtgga aattttggat 240 
tcctactacc agaggctgca tcggctgcgc gcagagcaga tggcgtcgta ttttgggcat 



300 
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tcagtggctg tcactgacgt caacggggat gggaggcatg atctgctggt gggcgctcca 360 
ctgtatatgg agagccgggc agaccgaaaa ctggccgaag tggggcgtgt gtatttgttc 420 
ctgcagccgc gaggccccca cgcgctgggt gcccccagcc tcctgctgac tggcacacag 
ctctatgggc gattcggctc tgccatcgca cccctgggcg acctcgaccg ggatggctac 
aatgacattg cagtggctgc cccctacggg ggtcccagtg gccggggcca agtgctggtg 
ttcctgggtc agagtgaggg gctgaggtca cgtccctccc aggtcctgga cagccccttc 660 
cccacaggct ctgcctttgg cttctccctt cgaggtgccg tagacatcga tgacaacgga 720 
tacccagacc tgatcgtggg agcttacggg gccaaccagg tggctgtgta cagagctcag 780 
ccagtggtga aggcctctgt ccagctactg gtgcaagatt cactgaatcc tgctgtgaag 840 
agctgtgtcc tacctcag 



480 
540 
600 
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